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Appendix I: Alignment of the CMV IE enhancer of M60321 with instant SEQ ID NO: 3 

BLASTN 2.2.25+ 

Reference: Zheng Zhang, Scott Schwartz, Lukas Wagner, and 
Webb Miller (2000), "A greedy algorithm for aligning DNA 
sequences", J Comput Biol 2000; 7 ( 1-2 ): 203-14 . 



RID: N05YT4ZW111 



Query= gi | 330624 | gb | M60321 . 1 | HS5MIEP Human cytomegalovirus major 
immediate-early protein gene, 5' end 

Length=2361 



Sequences producing significant alignments: 

lcl|26147 SID_3 

ALIGNMENTS 
>lcl|26147 SID_3 
Length=3584 

Score = 977 bits (529), Expect =0.0 
Identities = 543/549 (99%), Gaps = 3/549 (0%) 
Strand=Plus/Plus 



Score E 
(Bits) Value 



Query 535 ACCGCCATGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATT 594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 29 ACCGCCATGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATT 8 8 

Query 595 AGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTCG 654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 89 AGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGG 148 

Query 655 -TGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAAC 713 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 149 CTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAGC 208 

Query 714 GCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTT 7 73 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2 09 GCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTT 26 8 

Query 774 GGCAGTACATCAAGTGTATCATATGCCAAGTCCGGCCCCCTATTGACGTCAATGACGGTA 833 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 269 GGCAGTACATCAAGTGTATCATATGCCAAGTCC-GCCCCCTATTGACGTCAATGACGGTA 32 7 

Query 834 AATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTACGGGACTTTCCTACTTGGCAGT 893 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 32 8 AATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTACGGGACTTTCCTACTTGGCAGT 387 

Query 89 4 ACATCTACGTATTAGTCATCGCTATTACCATGGTG-ATGCGGTTTTGGCAGTACACCAAT 952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 388 ACATCTACGTATTAGTCATCGCTATTACCATGGTGGATGCGGTTTTGGCAGTACACCAAT 447 

Query 953 GGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAAT 1012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 448 GGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAAT 50 7 
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Query 1013 GGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAATAACCCCGCC 10 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 50 8 GGGAGTTTGTTTGGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAATAACCCCGCC 56 7 

Query 10 73 CCGTTGACG 1081 

I I I I I I I I I 
Sbjct 568 CCGTTGACG 576 
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